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见 的 一 类 ， 基 于 块 匹 配 检测 方 
度 ， 应 用 深度 学 习 特 征 和 聚 类 算法 进 


今 测 。 


0 
首先 用 稀 芍 自 编码 器 


言 迄 


时 间 复 杂 度 高 等 问题 ， 
训练 大 量 样本 


集 找 出 同 图 复制 图 像 的 内 部 规律 并 得 到 降 维 的 隐藏 层 权 值 和 矩阵 ， 通 过 权 值 矩阵 获得 检测 图 像 的 隐藏 层 特征 ， 即 定义 的 


稀疏 自 编 码 特 征 ; 用 KK-means 算法 一 次 聚 类 自 编码 特征 去 除 图 像 平滑 区 域 ， 


结果 中 含有 少量 异常 志 


改 区 域 的 检测 。 


与 聚 类 算法 结合 使 用 ， 
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二 次 聚 类 纹理 特征 获得 
通过 欧 氏 距离 判断 和 RANSAC (random sample consensus) 算法 将 异常 块 去 除 ， 从 而 实现 窜 
该 算法 与 其 他 算法 比较 综合 准确 率 提 升 14.3%， 时 间 效 率 提升 72%。 将 深度 学 习 特 征 


导 检测 双 


雪 果 ， 若 检测 


Imasge forgery detection based on sparse autoencoder feature and clustering algorithm 


Wang Mengsi, Huo Hongtao, Luo Xiaoyang 


(Institute of Information Technology & Network Security, People's Public Security University of China, Beijing 100038, China) 


Abstract: Copy-move forgery is a common type of image forgery. Block matching detection often has the problems of low 


accuracy and high time complexity. In order to improve the accuracy and significantly reduce the time complexity, this paper 


used deep learning characteristics and clustering algorithm for detecting. Firstly, it used the sparse autoencoder to find out the 


internal laws of the images and train the weight matrix of the hidden layer which obtained by a large number of sample sets. It 


obtained the hidden layer feature of the detection image by the weight matrix, that is, the sparse autoencoder feature. Secondly, 


it used the K-means algorithm to cluster the autoencoder features at the first time to remove the image smoothing region and to 


cluster the texture features to obtain the detection results. It used the Euclidean distance judgment and RANSAC (random sample 


consensus) algorithm to remove the abnormal blocks, in order to achieve tampering area detection. Experimental results show 


that the proposed algorithm can improve the accuracy by about 14.3% compared with other algorithms, and the time efficiency 


is improved by72%. The combination of the depth learning feature and the clustering algorithm makes the tampering of the 


copy-move forgery improved in both time efficiency and accuracy. 


Key Words: sparse autoencoder; K-means clustering algorithm; copy-move forgery; block matching algorithm 


0 ”引言 分 匹配 算法 的 步骤 为 将 图 像 分 成 重 辣 块 或 非 重 个 块 ， 提 取 每 个 
块 的 特征 进行 特征 匹配 , 找 出 窜改 区 域 。 特征 提取 步骤 中 , 根据 
随 着 信息 技术 的 发 展 , 图 像 编辑 软件 的 广泛 使 用 , 图 像 窜改 的 不 同 ， 所 选择 的 特征 也 不 尽 相 同 。 许 多 研究 者 选择 
已 变 得 平常 和 普遍 , 其 中 同 图 复制 窜改 是 最 常见 的 一 类 。 将 图 中 DCT(discrete cosine transformatiom) 系 数 G 7 作为 特征 以 提高 准确 
人 幅 图 中 的 其 他 区 域 , 再 经 过 模糊 、 边 率 , 并 增加 对 噪声 和 压缩 的 鲁 棒 性 , 也 有 选择 基于 傅 里 叶 变 换 镶 
缘 处 理 等 操作 便 能 达到 以 假 乱 真 的 效果 。 在 过 去 的 研究 中 , 同 图 或 小 波 变换 外 的 频率 域 特 征 , 可 有 效 降 低 时 间 复 杂 度 ， 有些 研究 
复制 检测 技术 主要 分 两 类 , 分 别 为 特征 点 匹配 和 块 匹 配 趾 特征。 ” 则 采用 空间 域 特征 ， 如 基于 颜色 不 变性 909、 基于 纹理 特征 D、 
点 匹配 中 较为 著名 的 算法 有 SIFT(scale invariant feature 基于 灰 度 特征 0243 等 , 相 比 于 频率 域 特 征 ， 空 间 域 特征 大 幅度 降 
transform)PD、 SURF(speed up robust features)51] 和 MIFT(mirror 低 特 征 维 度 , 减少 计算 量 , 增加 效率 。 这 些 传 统 的 特征 提取 方法 
reflection invariant feature transform) 上 四 等 。 在 块 匹 配 算法 中 , 大 部 ”往往 会 受 图 像 自身 变化 影响 ， 提 取 的 特征 并 不 能 完全 反映 出 物 
基金 项 目 : 公安 部 技术 研究 计划 项 目 〈2014JSYJB007) 
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主要 研究 方向 为 网 络 安全 、 模 式 识别 ; 罗 霄 阳 〈1992-)， 男 ， 硕 士 ， 主 要 研究 方向 为 网 络 安全 、 模 式 识别 . 
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体 的 本 质 属 性 ， 无 法 获得 图 像 更 深层 次 的 信息 。 
深度 学 习 是 近年 来 研究 的 热点 ， 相 较 于 传统 的 模式 识别 方 
法 , 它 可 以 从 数据 中 自动 学 习 特征 , 试图 找到 数据 的 内 部 结构 ， 
发 现 变量 之 间 的 真正 关系 形式 ， 其 特征 表达 能 力 要 优 于 传统 方 
法 并 且 对 大 数据 的 丰富 内 在 信息 更 有 代表 性 。 深 度 学 习 应 用 范 
广泛 , 在 图 像 处 理 方面 , 绝 大 部 分 研究 集中 于 图 像 识 别 04、 图 
像 分 类 05 或 检测 图 像 拼接 09 等 方面 ， 并 多 与 分 类 算法 相 结合 。 
在 图 像 窜改 检测 方面 ， 特 别 是 同 图 复制 检测 技术 还 少 有 应 用 。 
聚 类 算法 在 同 图 复制 窜改 检测 中 已 有 应 用 ， 其 中 应 用 较 多 
的 聚 类 算法 为 K-meanst1"1, 聚 类 的 优势 在 于 降低 时 间 复 杂 度 , 减 
少 计算 量 。 应 用 深度 学 习 特征 , 结合 其 他 特征 和 聚 类 算法 ,检测 
能 准确 定位 复制 粘贴 窜改 区 域 是 本 文 研究 的 主要 内 容 。 

为 提高 检测 准确 率 , 降低 时 间 复 杂 度 , 本 文 将 图 像 分 为 若干 
重 生 块 ， 并 选择 基于 稀疏 自 编码 (sparse autoencoder SAE) 神 经 网 
络 提取 分 块 的 隐 性 特征 ， 应 用 K-means 聚 类 算法 去 除 背 景 定位 
复制 区 域 ， 再 提取 剩余 分 块 纹理 特征 ， 使 用 作 二 次 聚 
类 , 得 到 窜改 区 域 检测 图 。 若 仍 有 非 窗 改 区 域 的 异常 块 , 则 使 用 
欧 氏 距离 判定 和 RANSAC 算法 去 除 异常 ， 从 而 实现 同 图 复制 罕 
改 检测 。 实验 结果 表明 , 该 算法 在 时 间 效 率 和 准确 率 上 都 要 优 于 
其 他 算法 ， 并 对 JPEG 压缩 也 有 很 好 的 鲁 棒 性 。 


1 ” 稀 琉 自 编码 器 


自 编 码 神经 网 络 (autoencoder) 是 一 种 无 监督 的 学 习 算法 ， 
它 使 用 反 向 传播 算法 , 让 样本 的 输出 值 等 于 输入 值 , 如 果 输 入 数 
据 间 隐 含 有 某 些 有 联系 的 特定 结构 ， 那 么 自 编码 算法 就 能 发 现 
这 些 有 联系 数据 间 的 相关 性 ， 并 在 输出 层 重 构 出 输入 数据 05。 
自 编码 神经 网 络 的 简单 示意 图 。 其 中 
{Xn,x ,LL ,xzo) 为 训练 样本 集合 ， Xw <R， 即 输入 层 L1, L2 
为 隐藏 层 ， 输 出 层 L3: 和 CoOsx ，+1 为 偏 置 项 〈 截 距 项 ) 系 
数 , W 是 权重 参数 ，b 为 截 距 。 


K-means 


图 1 是 一 个 


hwp(x) 


Layer L; Layer La 


Layer Li 


图 1 


自 编码 神经 网 络 示例 


在 该 神经 网 络 中 加 入 一 些 条 件 ， 如 限制 隐藏 层 L2 中 神经 元 
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的 个 数 ， 则 会 出 现 菜 种 特定 结构 ， 该 结构 可 让 Ls 重 构 L3。 设 神 


经 元 的 激活 函数 是 sigmoid 函数 f(x) 


接近 于 1 的 时 


玻 性 限制 使 输 


例 ， 则 公式 如 下 : 


1 ， 当 神经 元 的 输出 


二 


候 则 为 激活 状态 ， 接 近 0 的 时 候 为 抑制 状态 ， 稀 


出 接近 于 0。 著 共 《(az0,y0) .Cdtm ,yo 到 个 样 


2 ye] 0) 


a 中 表示 当 输 入 为 x 情况 下 隐藏 神经 元 j 的 激活 度 , P 表 


示 j 的 平均 活 
数 ， 其 值 接 近 
平均 活跃 度 则 
公式 如 下 : 


532 可 bs 
> KL(p]| 六 ) Dplog £ +(1—p)log 2 
7 j=1 1 1-p 


跃 度 ， 加 入 限制 条 件 , 令 Pp,=p ，p 是 稀 玻 性 参 
于 0， 当 隐藏 层 神经 元 平均 活跃 度 接近 于 p 时 ， 
接近 于 0， 同 时 加 入 惩罚 因子 降低 平均 活跃 度 。 


(2) 


了 7 


。 是 隐藏 层 中 隐藏 神经 元 的 数量 ， 索 引 j 依次 代表 隐藏 层 
中 的 每 一 个 神经 元 ，KL(p|| 5 ) 是 一 个 以 p 为 均值 和 一 个 以 


局 为 均值 的 玉 
KL(p||P,)=0 


个 伯 努 利 随 机 变量 之 间 的 相对 和 。 当 p=p 时 
， 这 样 ， 总 体 代 价 函数 为 


J ne (W,b) = 二 > —h,, (x 外 二 
i=1 (3) 


BSI+l 


A 2 
335) (ww) + BK) 
亡 1 


1=1 gq=1 p=1 


编码 神经 网 络 层 数 ;， 4 为 规则 化 系数 ， B 是 控制 


其 中 : n, 为 自 
稀 玻 性 限制 惩 


罚 项 的 系数 ， h(x') 是 第 ;组 神经 网 络 输出 层 的 


输出 值 。 式 (3) 采用 迭代 法 算 取 平均 激活 度 6 ， 当 迭代 达到 设 
定 值 或 算法 收敛 时 停止。 


2 ”特征 聚 类 算法 


2.1 本文 算法 流程 
将 SAE 特征 结合 聚 类 算法 检测 同 图 复制 窜改 是 本 文 的 主要 
思想 ， 有 具体 流程 如 图 2 所 示 。 


合并 非 最 太 类 ， eo k-means 聚 类 。 


提取 纹理 特征 4 


-一 到 


RANSAC+ 输出 0 


图 2 


本 文 算法 流程 
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总 结 步 又 如 下 : 

a) 将 图 像 转 为 灰 度 
每 块 的 SAE 特征 ; 

b) 应 用 K-means 聚 类 将 平滑 区 域 去 除 ， 即 排除 含 最 大 块 数 
的 类 ， 合 并 剩余 类 ; 

c) 将 剩余 类 里 的 块 提取 纹理 特征 进行 K-means 二 次 聚 类 ， 
根据 图 像 的 复杂 程度 不 同 , 此 时 有 些 图 像 已 可 以 成 功 检 测 , 检测 
结果 在 二 次 聚 类 后 的 某 一 类 中 ; 

d) 若 有 些 图 像 仍 存在 少量 异常 块 〈 非 窜改 区 域 )， 使 用 欧 氏 
距离 判断 和 RANSAC 算法 将 异常 块 去 除 ,保留 完整 的 复制 粘贴 
区 域 。 

2.2 SAE 特征 提取 

将 竺 检测 图 像 转 换 为 灰 度 图 像 后 ， 将 图 像 分 成 nxn 大 小 的 
块 。 为 提高 效率 ， 采 用 间隔 4 行 4 列 分 块 。 此 时 ， 应 用 稀 玻 自 
编码 器 , 输入 特征 值 ? 维 , 输出 隐藏 层 特征 算 阵 m? 维 


no 


图 像 后 , 进行 间隔 为 d 的 重 受 分 块 ， 提取 


，m 小 于 


通过 在 稀 疏 自 编码 器 中 训练 大 量 样本 ， 增 加 迭代 次 数 ,发 现 
样本 中 的 规律 ， 得 到 最 终 收 敛 的 隐藏 层 权重 参数 矩阵 W 和 截 距 
b。 


若 设 定 输入 为 16x16=256 维特 征 的 样本 ， 隐 藏 层 输出 为 25 
特征 ， 示 例如 下 ; 


ASS 


输入 层 输出 层 
下 =[ ] .于 是 256xn 的 矩阵 , 这 里 的 了 是 指 训练 样本 
集中 每 张 图 片 的 所 有 分 块 ， 即 将 图 片 分 块 ， 块 大 小 为 16 x 16， 
归 成 列 向 量 256 维 ， 所 有 图 片 分 人 下 
W! =[ | 25 表示 隐藏 层 节点 数 ， 行 代表 每 个 输 
入 特征 与 隐藏 层 第 i 个 节点 的 系数 。256 代表 输入 节点 数 ， 第 j 
列表 示 输 入 特征 和 第 j 个 节点 的 系数 。p'=[ ]，， 
Z =W!'x 于 +b'-[ ],,。， 得 到 的 Z 为 256 维 原始 输入 向 量 的 
25 维特 征 表示 矩阵， 本 文 将 到 和 妨 统 一 表示 为 玉 。 例如 ZZ 为 
一 个 块 的 25 维特 征 和 矩阵 (保留 两 位 小 数 )。 


3.18 0.60 3.32 -0.59 8.29 | 
2.48 -11.22 -7.24 -3.23 1.61 
2Z1=| -1.36 1.33 -5.25 -1.56 -1.01 
1.29 -1.43 3.85 -2.33 -4.88 
0.23 -6.48 -3.79 -2.42 2.25 | 


稀 玻 自 编码 提取 图 像 的 特征 为 隐藏 层 单元 对 图 像 不 同方 向 
和 不 同位 置 的 边缘 检测 , 相 较 于 一 般 边缘 检测 算 子 如 Laplacian、 
Prewitt 等 ， 其 优势 也 很 明显 ， 稀 玻 自 编 码 强 调 图 像 深 层 内 部 特 
征 , 着 重 于 图 形 整 体 , 所 以 针对 外 部 条 件 变换 具有 更 好 的 稳定 性 ， 
这 种 特征 适用 于 结合 其 他 算法 进行 进一步 对 于 图 像 的 操作 。 
2.3 k-means 聚 类 算法 
k-means 算法 将 基于 特征 的 对 象 中 任意 选择 k 个 对 象 作 为 
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四 始 聚 类 中 心 ,将 剩余 对 象 根 据 聚 类 中 心 的 相似 度 划 分 k 隔 艇 ， 
oi 罕 类 中 心 , 直到 目标 函数 达到 收敛 即 可 。 准则 
函数 公式 如 下 ,为 指定 的 聚 类 数目 ，D 为 样本 数 。 


d= minY Ddist(D,,x) (4) 


i=] xeD; 


标 函 数 达 到 簇 不 发 生变 化 或 者 设 定 最 大 的 迭代 次 数 即 可 
终止 。 算 法 流程 如 图 3 所 示 。 


聚 类 元 目 K+ 
特征 集合 D* 


有 D 中 随机 季 选 K 个 样 
本 数据 作为 初始 中 心 点 + 


根据 中 心 点 将 D 分 类 + 


计算 准则 函数 d+ 


图 3 KK-means 算法 流程 


从 图 像 伪造 数据 库 CASIATIDE V 2.0' 选 取 若 干 图 像 进行 测 
试 ,将 测试 图 像 的 稀 玻 自 编码 特征 进行 kmeans 聚 类 , 设 定 k=5， 
根据 k-means 特性 , 每 个 聚 类 应 集中 分 布 于 图 像 不 同 区 域 ,而 将 
含有 最 大 块 数 的 聚 类 在 图 像 中 可 视 化 后 发 现 其 分 块 分 布 在 整 
图 像 ， 故 将 其 排除 , 剩 下 的 4 个 聚 类 的 块 合并 , 得 到 合并 类 矩阵 
A， 可 视 化 的 效果 如 图 4 所 示 。 


pa 


图 4 左 : 原 图 中 : 窜改 图 ! 右 : 检测 结果 


从 图 4 中 可 以 看 出 ， 稀 玻 自 编码 特征 可 完整 描述 图 像 边 缘 
信息 , 若 图 像 只 有 窜改 区 域 , 则 直接 得 出 检验 结果 , 若 图 像 中 除 
窜改 区 域外 还 包括 其 他 图 形 ， 则 测试 结果 如 图 5 所 示 。 


= 


图 5 左 : 原 图 中 : 窜改 图 ! 右 : 检测 结果 


1 CASIA Image Tampering Detection Evaluation Database,Ver.2.0,2010,http://forensics.idealtest.org. 
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从 图 5( 右 ) 显示 结果 来 看 ， 若 图 像 中 含 其 他 图 形 ， 合 并 类 


里 会 存在 异常 块 (在 非 窜改 


区 域 )。 由 此 可 见 ，SAE 特征 结合 lc 


means 算法 可 将 大 面积 的 图 


像 平滑 区 域 去 除 , 这 样 大 大 减少 计算 


量 , 即使 出 现 异 常 块 , 仅 需 处 理 合 并 类 , 将 图 像 的 异常 块 去 除 。 


提取 合并 类 A 里 每 个 分 块 的 基于 灰 度 共生 和 矩阵 的 纹理 特征 
组 成 特征 矩阵 了 ， 将 B 进行 K-means 二 次 聚 类 。 这 样 做 的 目的 
是 , 根据 分 块 纹理 特征 的 差异 , K-means 可 较 好 地 将 复制 粘贴 区 


域 块 聚 类 , 进一步 区 分 窜改 块 和 异常 块 。 在 二 次 聚 类 后 , 会 出 现 


两 种 情况 , 一 是 某 一 类 中 的 结果 为 无 异常 块 的 窜改 区 域 , 即 完整 


检测 出 复制 粘贴 区 域 ; 二 是 


依旧 存在 少量 异常 块 , 需 进一步 去 除 。 


2.4 去 除 异 常 块 


根据 式 〈5) 算出 聚 类 


是 否 符合 设 定 的 阔 值 , 若 小 于 阔 值 则 保留 , 否则 认为 两 块 不 匹配 。 


= 一 G) 
癌 


将 余下 匹配 块 结果 点 对 的 坐标 为 输入 , 应 用 RANSAC 算法 


两 两 块 特征 向 量 的 欧 氏 距离 ， 判 断 


去 除 点 对 集合 中 的 异常 块 , 保留 正常 块 , 进而 循环 建立 原始 区 域 
和 复制 伪造 区 域 之 间 的 仿 射 变换 矩阵 ，RANSAC 生成 的 仿 射 变 


换 和 矩阵 很 好 地 反映 了 原始 区 域 和 窜改 区 域 之 间 的 位 置 变换 关系 


[1 。 


3 ”实验 结果 


3.1 针对 不 同情 况 准 确 率 的 检测 


在 前 期 工作 中 ,用 稀 琉 


窗 
局 


自 编码 器 训练 图 库 里 的 70 张 复制 鲁 


Le: 
由 


改 图 像 ， 设 定 n=16，m=5， 


大 和 迭代 数 N=8000, 得 到 的 权 


d=4, 入 =0.0001，B=3，p=0.01， 最 
重 参数 矩阵 丈 与 图 像 分 块 矩 阵 天 相 


乘 ，K 的 一 列 是 一 个 块 的 特 和 
图 复制 窜改 图 像 进行 检测 ， 
92.5%。 


全 


则 会 降低 准确 率 , 综合 考虑 


E 向 量 。 本 文选 取 图 库 里 的 40 张 同 
完整 地 检测 出 37 张 图 识别 达到 


日 于 RANSAC 算法 的 输入 量 越 大 ， 用 时 越 多 ， 而 输入 量 小 


naxiy 合 作 期 刊 
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分 为 正 例 的 个 数 ; FN 是 指 将 正 例 漏 判 的 个 数 0。 


表 1 为 图 6 不 同 QF 下 的 两 种 算法 precision 值 ， 表 2 为 图 
6 不同 QF 下 的 两 种 算法 recall 值 。 


图 6 左 : 原 图 ; 中 : 帘 改 图 右 : 检测 图 


表 1 图 6 不 同 QF 下 的 两 种 算法 precision 值 
QF=100 QF=95 QF=75 QF=50 


[13] 0.874 0.816 0.723 0.577 


本 文 0.930 0.894 0.831 0.791 


表 2 图 6 不 同 QF 下 的 两 种 算法 recall 值 
QF=100 QF=95 QF=75 QF=50 


[13] 0.881 0.825 0.753 0.607 


本 文 。 0.943 0.906 0.869 0.802 


在 检测 
80，75 的 准确 率 和 召 


的 40 张 图 中 统计 其 中 20 张 图 在 QF=95，90，85， 
率 ， 以 确定 本 文 算法 针对 JPEG 压缩 的 


| 


和 鲁 棒 性 ， 如 图 7 所 示 。 


算法 时 间 效 率 和 准确 率 两 方面 因素 ， 


设 定 输入 量 即 输入 块 的 个 数 范围 me[300,?7000], 欧 氏 距离 阐 
值 设 定 范围 为 4 e(0.02,8.10) 。 实 验 结果 表明 ， 当 4 <0.02 时 ， 


约 74% 的 测试 图 像 jy < 300， 
约 81% 的 测试 图 像 jy > 1000 ， 


值 初始 设 定 值 为 q =0.05, 忆 


从 而 增 大 漏 判 数 ， 当 gq > 0.10 时 ， 
从 而 降低 时 间 效 率 。 本 文 实验 阔 
民 据 m 值 的 范围 ， 自 动 调整 4 的 大 


小 ， 调 整 值 为 每 次 4 =4 +0.015。 将 检测 图 像 进行 图 像 形 态 学 
操作 优化 处 理 ， 最 终 得 到 仿真 结果 如 图 6 所 示 。 

同时 将 图 6 四 组 图 进行 3 种 不 同 程度 的 JPEG 压缩 。 分 别 
设置 JPEG 压缩 质量 因子 (quality factor QF) QF=95,75,50 进行 对 
于 压缩 图 片 的 检测 , 将 模拟 文献 [13] 算 法 的 实验 结果 作为 参照 。 


通过 计算 准确 率 (precision) 秆 
回 率 公式 如 下 : 


precision= 


TP 


0 召回 率 (recall) 来 测评 ,准确 率 和 召 


recall= TE 


TP+FP TP+FN 


4 


其 中 : TP 是 指 被 正确 地 划分 为 正 例 的 个 数 ; FP 是 指 被 错误 地 划 


0.88 
0.86 


—— Precision 


-一 Recall 


QF=95 QF=90 QF=85 QF=80 QF=75 


图 


7 不 同 QF 下 的 本 文 算法 precision 和 recall 值 


可 见 针对 JPEG 压缩 ，SAE 特征 的 稳定 性 较 好 ， 算 法 检测 


率 也 优 于 其 他 算法 。 


3.2 时间 效率 检测 
除了 检测 准确 率 提升 外 ， 本 文 算法 的 突出 优势 在 于 极 大 地 


种 情况 : 
a) 图 像 


降低 时 间 复 杂 度 , 提升 计算 效率 。 本 文 算法 的 平均 


时 计算 分 三 


—— 


背景 为 平滑 区 域 ， 除 背景 外 只 有 复制 粘贴 窜改 区 域 ， 


录用 稿 


] K-means 算法 便 可 完整 地 检测 


此 情况 仅 需 提取 SAE 特征 并 应 
出 ， 其 平均 用 时 1.87 s。 

b) 图 像 中 除 窜改 区 域 , 还 有 其 他 图 形 , 此 情况 除了 用 情况 a) 
的 步骤 外 ， 还 需 提取 纹理 特征 ， 使 用 K-means 二 次 聚 类 ， 此 时 
某 一 聚 类 中 有 完整 的 窜改 检测 结果 ， 其 平均 用 时 18.26 s。 


| 


c) 二 次 聚 类 后 ， 仍 有 异常 块 ， 此 时 需 使 用 欧 氏 距离 和 
RANSAC 算法 去 除 异 常 块 ， 其 平均 用 时 如 表 3 所 示 ， 并 与 文献 
[13] 做 对 比 。 

表 3 两 种 算法 的 平均 用 时 /s 


文献 [13] ” 本文 ”提升 率 


109.55 19.37 82% 


416.37 127.41 69% 


总 共 525.92 146.78 72% 


4 ”结束 语 


为 了 提升 块 匹 配 算法 的 准确 率 和 时 间 效 率 ， 本 文 提出 将 深 
度 学 习 特征 和 K-means 聚 类 算法 相 结合 ， 从 而 检测 同 图 复制 窜 
改 区 域 。 实验 结果 表明 , 在 准确 率 上 , 不 同 压缩 程度 的 图 像 检测 


结果 皆 优 于 其 他 算法 , 而 时 间 效 率 也 大 幅度 提 于 
习 在 同 图 复制 窜改 检测 中 具有 很 好 的 应 用 性 。 在 未 来 的 工作 中 ， 
可 进一步 探索 自 编码 神经 网 络 在 此 领域 的 应 用 ， 如 图 像 窜改 区 
域 经 缩放 或 旋转 等 处 理 。 
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